人们使用移动消息传递服务的增加导致了像网络钓鱼一样的社会工程攻击的传播,考虑到垃圾邮件文本是传播网络钓鱼攻击的主要因素之一,以窃取信用卡和密码等敏感数据。此外,关于Covid-19大流行的谣言和不正确的医疗信息在社交媒体上广泛分享,导致人们的恐惧和混乱。因此,过滤垃圾邮件内容对于降低风险和威胁至关重要。以前的研究依赖于机器学习和深入学习的垃圾邮件分类方法,但这些方法有两个限制。机器学习模型需要手动功能工程,而深度神经网络需要高计算成本。本文介绍了一种动态的深度集合模型,用于垃圾邮件检测,调整其复杂性并自动提取功能。所提出的模型利用卷积和汇集层进行特征提取以及基础分类器,如随机森林和极其随机的树木,用于将文本分类为垃圾邮件或合法的树。此外,该模型采用了Boosting和Bagging等集合学习程序。结果,该模型达到了高精度,召回,F1分数和精度为98.38%。
translated by 谷歌翻译
Diabetic Retinopathy (DR) is a leading cause of vision loss in the world, and early DR detection is necessary to prevent vision loss and support an appropriate treatment. In this work, we leverage interactive machine learning and introduce a joint learning framework, termed DRG-Net, to effectively learn both disease grading and multi-lesion segmentation. Our DRG-Net consists of two modules: (i) DRG-AI-System to classify DR Grading, localize lesion areas, and provide visual explanations; (ii) DRG-Expert-Interaction to receive feedback from user-expert and improve the DRG-AI-System. To deal with sparse data, we utilize transfer learning mechanisms to extract invariant feature representations by using Wasserstein distance and adversarial learning-based entropy minimization. Besides, we propose a novel attention strategy at both low- and high-level features to automatically select the most significant lesion information and provide explainable properties. In terms of human interaction, we further develop DRG-Net as a tool that enables expert users to correct the system's predictions, which may then be used to update the system as a whole. Moreover, thanks to the attention mechanism and loss functions constraint between lesion features and classification features, our approach can be robust given a certain level of noise in the feedback of users. We have benchmarked DRG-Net on the two largest DR datasets, i.e., IDRID and FGADR, and compared it to various state-of-the-art deep learning networks. In addition to outperforming other SOTA approaches, DRG-Net is effectively updated using user feedback, even in a weakly-supervised manner.
translated by 谷歌翻译
自然语言和生物学序列之间的明显相似之处已导致最新的深层语言模型(LMS)在抗体和其他生物学序列分析中的应用激增。但是,缺乏对生物序列语言的严格语言形式化,这些语言将定义基本组成部分,例如词典(即语言的离散单元)和语法(即,将序列序列良好的规则,结构和结构和结构和结构和结构链接的规则链接在一起含义)导致了LMS的主要域无规定应用,这些应用未考虑研究的生物序列的基础结构。另一方面,语言形式化为LM应用建立了语言信息,因此适应域的组件。它将有助于更好地理解自然语言和生物序列之间的差异和相似性如何影响LMS的质量,这对于具有可解释的模型具有可解释的模型至关重要。解密抗体特异性规则对于加速有理和硅生物治疗药物设计至关重要。在这里,我们将抗体语言的特性形式化,因此不仅建立了语言工具在适应性免疫受体分析中应用的基础,而且还为免疫受体特异性的系统免疫语言学研究提供了基础。
translated by 谷歌翻译
3D Flash LiDAR是传统扫描激光雷达系统的替代方法,有望在紧凑的外形尺寸中进行精确的深度成像,并且没有运动部件,例如自动驾驶汽车,机器人技术和增强现实(AR)等应用。通常在图像传感器格式中使用单光子,直接飞行时间(DTOF)接收器实施,设备的操作可能会受到需要在室外场景中处理和压缩的大量光子事件的阻碍以及对较大数组的可扩展性。我们在这里提出了一个64x32像素(256x128 spad)DTOF成像器,该成像器通过将像素与嵌入式直方图使用像素一起克服这些局限性,该直方直方图锁定并跟踪返回信号。这大大降低了输出数据帧的大小,可在10 kfps范围内或100 kfps的最大帧速率进行直接深度读数。该传感器可选择性地读数检测表面或传感运动的像素,从而减少功耗和片外处理要求。我们演示了传感器在中端激光雷达中的应用。
translated by 谷歌翻译
基于神经网络的深层语言模型(LMS)越来越多地应用于大规模蛋白质序列数据以预测蛋白质功能。然而,作为黑框模型,当前的蛋白质LM方法并不促进对序列功能映射的基本理解,而阻碍了基于规则的生物治疗药物开发,因此目前的蛋白质LM方法不大。我们认为,从语言学中得出的指导是从自然语言数据中提取分析规则的领域,可以帮助构建学习相关领域特定规则的更容易解释的蛋白质LM。与自然语言LMS相比,蛋白质序列数据和语言序列数据之间的差异需要在蛋白质LMS中集成更多的域特异性知识。在这里,我们为培训数据,令牌化,令牌嵌入,序列嵌入和模型解释提供了基于语言学的路线图。将语言学与蛋白质LMS结合起来,可以发展下一代可解释的机器学习模型,并有可能发现序列功能关系基础的生物学机制。
translated by 谷歌翻译
Inspired by progress in large-scale language modeling, we apply a similar approach towards building a single generalist agent beyond the realm of text outputs. The agent, which we refer to as Gato, works as a multi-modal, multi-task, multi-embodiment generalist policy. The same network with the same weights can play Atari, caption images, chat, stack blocks with a real robot arm and much more, deciding based on its context whether to output text, joint torques, button presses, or other tokens. In this report we describe the model and the data, and document the current capabilities of Gato.
translated by 谷歌翻译
大规模捆绑调整(BA)是许多3D视觉应用的关键(例如,结构 - 从 - 动态和SLAM)。虽然重要的是,现有的BA库(例如,CERES和G2O)仍然很差。这些库利用加速器(即,GPU),并且它们缺少算法以在单个设备上分配由存储器限制的BA计算。在本文中,我们提出了Megba,为大型BA的高性能和分布式库。 Megba具有新的端到端VectorAised BA算法,可以充分利用GPU上的大规模并行核心,从而加速整个BA计算。它还具有一种新型分布式BA算法,可以自动分区BA问题,并使用分布式GPU解决BA子问题。 GPU使用网络有效的集体通信使中间求解状态同步,并且设计以最小化通信成本。 Megba具有内存高效的GPU运行时,并公开G2O兼容的API。实验表明,在公共大规模BA基准中,MEGBA可以在公共大规模BA基准中推出高达33倍和3.3倍的最先进的BA库(即,CERES和DEEPLM)。 Megba的代码可用于:\ url {https://github.com/megviirobot/megba}。
translated by 谷歌翻译
在本文中,我们介绍了对非对称确定点处理(NDPP)的在线和流媒体地图推断和学习问题,其中数据点以任意顺序到达,并且算法被约束以使用单次通过数据以及子线性存储器。在线设置有额外要求在任何时间点维护有效的解决方案。为了解决这些新问题,我们提出了具有理论担保的算法,在几个真实的数据集中评估它们,并显示它们对最先进的离线算法提供了可比的性能,该算法将整个数据存储在内存中并采取多次传递超过它。
translated by 谷歌翻译
老年人的数量越来越多,对医疗保健以及特别是康复医疗保健令人担忧。辅助技术和辅助机器人特别可能有助于改善这一过程。我们开发一个能够向患者展示康复锻炼的机器人教练,观看患者进行练习并给予他的反馈,以提高他的表现并鼓励他。该系统的HRI基于我们的研究与康复治疗师和目标人群的团队。系统依赖于人类运动分析。我们开发了一种学习概率表达的方法,从专家演示中学习理想运动。使用使用Microsoft Kinect V2捕获的位置和取向特征采用高斯混合模型。为了评估患者的动作,我们提出了一个时间的多级分析,暂时和空间上识别并解释了身体部位误差。该分析与分类算法相结合允许机器人提供教练建议,以使患者提高他的运动。三次康复演习的评价表明了提出的学习和评估Kinaesthetic运动的方法。
translated by 谷歌翻译
几乎所有知识库的陈述都有时间范围,在此期间它们有效。因此,在时间知识库(TKB)上的知识库完成(KBC),其中每个陈述\ TEXTIT {MAY}与时间范围相关联,引起了不断的关注。先前作品假设TKB \ Texit {必须}中的每个语句都与时间范围相关联。这忽略了kB中常规缺少的范围信息。因此,在此之前的工作通常不能处理通用用例,其中TKB由具有/没有已知的时间范围的时间语句组成。为了解决这个问题,我们建立了一个名为time2box的新知识库嵌入框架,可以同时处理不同类型的atemporal和时间陈述。我们的主要洞察力是时间查询的答案始终属于时间不可知的对应物的答案子集。换句话说,时间是一个过滤器,有助于在某些时期内挑选答案。我们介绍框以将一组答案实体代表到一个时间不可知的查询。时间过滤功能由这些框的交叉点建模。此外,我们概括了关于时间间隔预测的当前评估协议。我们描述了两个数据集上的实验,并表明所提出的方法优于链路预测和时间预测上的最先进的(SOTA)方法。
translated by 谷歌翻译